可解释的人工智能方法(XAI)用于地球科学应用中,以洞悉神经网络(NNS)的决策策略(NNS),强调了输入中哪些功能对NN预测的影响最大。在这里,我们讨论了我们的教训,了解到将预测归因于输入的任务没有单个解决方案。相反,归因结果及其解释在很大程度上取决于XAI方法使用的考虑的基线(有时称为参考点)。到目前为止,这一事实在文献中被忽略了。该基线可以由用户选择,也可以是通过方法S算法中的构造设置的,通常没有用户意识到该选择。我们强调说,不同的基线可以为不同的科学问题提供不同的见解,因此应相应地选择。为了说明基线的影响,我们使用SSP3-7.0场景强迫的历史和未来气候模拟的大量合奏,并训练完全连接的NN来预测集团和全球均值温度(即强迫全球变暖信号)给定单个合奏成员的年度温度图。然后,我们使用各种XAI方法和不同的基线将网络预测归因于输入。我们表明,在考虑不同的基准时,归因在于回答不同的科学问题,因为它们会有很大差异。我们通过讨论有关基准在XAI研究中使用的一些重要含义和考虑因素来结束。
translated by 谷歌翻译
拓扑数据分析(TDA)是来自数据科学和数学的工具,它开始在环境科学领域引起波浪。在这项工作中,我们寻求对TDA工具的直观且可理解的介绍,该工具对于分析图像(即持续存在同源性)特别有用。我们简要讨论理论背景,但主要关注理解该工具的输出并讨论它可以收集的信息。为此,我们围绕着一个指导示例进行讨论,该指导示例是对RASP等人研究的糖,鱼类,花朵和砾石数据集进行分类。 al。 2020年(Arxiv:1906:01906)。我们证明了如何使用简单的机器学习算法来获得良好的结果,并详细探讨了如何用图像级特征来解释这种行为。持续同源性的核心优势之一是它的解释性是可解释的,因此在本文中,我们不仅讨论了我们发现的模式,而且要考虑到为什么我们对持续性同源性理论的了解,因此可以期待这些结果。我们的目标是,本文的读者将更好地了解TDA和持续的同源性,能够确定自己的问题和数据集,为此,持续的同源性可能会有所帮助,并从应用程序中获得对结果的理解包括GitHub示例代码。
translated by 谷歌翻译
In the last decade, much work in atmospheric science has focused on spatial verification (SV) methods for gridded prediction, which overcome serious disadvantages of pixelwise verification. However, neural networks (NN) in atmospheric science are almost always trained to optimize pixelwise loss functions, even when ultimately assessed with SV methods. This establishes a disconnect between model verification during vs. after training. To address this issue, we develop spatially enhanced loss functions (SELF) and demonstrate their use for a real-world problem: predicting the occurrence of thunderstorms (henceforth, "convection") with NNs. In each SELF we use either a neighbourhood filter, which highlights convection at scales larger than a threshold, or a spectral filter (employing Fourier or wavelet decomposition), which is more flexible and highlights convection at scales between two thresholds. We use these filters to spatially enhance common verification scores, such as the Brier score. We train each NN with a different SELF and compare their performance at many scales of convection, from discrete storm cells to tropical cyclones. Among our many findings are that (a) for a low (high) risk threshold, the ideal SELF focuses on small (large) scales; (b) models trained with a pixelwise loss function perform surprisingly well; (c) however, models trained with a spectral filter produce much better-calibrated probabilities than a pixelwise model. We provide a general guide to using SELFs, including technical challenges and the final Python code, as well as demonstrating their use for the convection problem. To our knowledge this is the most in-depth guide to SELFs in the geosciences.
translated by 谷歌翻译
卷积神经网络(CNN)最近由于捕获非线性系统行为并提取预测性时空模式而引起了地球科学的极大关注。然而,鉴于其黑盒的性质以及预测性的重要性,可解释的人工智能方法(XAI)已成为解释CNN决策策略的一种手段。在这里,我们建立了一些最受欢迎的XAI方法的比较,并研究了它们在解释CNN的地球科学应用决策方面的保真度。我们的目标是提高对这些方法的理论局限性的认识,并深入了解相对优势和缺点,以帮助指导最佳实践。所考虑的XAI方法首先应用于理想化的归因基准,在该基准中,该网络解释的基础真实是先验,以帮助客观地评估其性能。其次,我们将XAI应用于与气候相关的预测设置,即解释CNN,该CNN经过训练,可以预测气候模拟每日快照中的大气河流数量。我们的结果突出了XAI方法的几个重要问题(例如,梯度破碎,无法区分归因的迹象,对零输入的无知),这些迹象以前在我们的领域被忽略了,如果不谨慎地考虑,可能会导致扭曲的图片CNN决策策略。我们设想,我们的分析将激发对XAI保真度的进一步调查,并将有助于在地球科学中谨慎地实施XAI,这可能导致进一步剥削CNN和深入学习预测问题。
translated by 谷歌翻译
鉴于人工智能(AI)和机器学习(ML)方法越来越多,环境科学各方面的方法,我们必须讨论关于AI的道德和负责任使用。事实上,大大可以从其他领域学习,通常是最好的意图,但经常导致意外的社会后果,如刑事司法系统中的硬编码种族偏见或通过金融体系增加经济不平等。常见的误解是,当使用AI时,环境科学对这种非预期的后果免疫,因为大多数数据来自观察,并且AI算法基于数学公式,这些公式通常被视为物镜。在本文中,我们争论可能就是这样。使用具体示例,我们展示了许多方式,其中使用AI可以引入环境科学的类似后果。本文将刺激讨论和研究努力。作为一个社区,我们应该通过引入AI来避免重复在其他域中的任何可预见的错误。事实上,通过适当的预防措施,AI可以成为帮助{\它减少}气候和环境不公正的伟大工具。我们主要关注天气和气候示例,但结论普遍存在环境科学中。
translated by 谷歌翻译
尽管神经网络越来越成功地应用于地球科学中的许多问题,但它们的复杂和非线性结构使对预测的解释变得困难,这限制了模型的信任,并且不允许科学家对眼前的问题获得身体上的见解。在可解释的人工智能(XAI)的新兴领域中引入了许多不同的方法,旨在将网络的预测归因于输入域中的特定特征。通常使用基准数据集(例如MNIST或Imagenet进行图像分类)评估XAI方法。但是,对于大多数这些数据集而言,缺乏归因的客观,理论上得出的地面真理,因此在许多情况下对XAI进行了评估。同样,专门针对地球科学问题设计的基准数据集很少见。在这里,我们根据使用可分离功能的使用提供了一个框架,以生成归因基准数据集,以解决回归问题,该问题是归因的基础真理。我们生成一个大型基准数据集并训练一个完全连接的网络,以学习用于仿真的基础功能。然后,我们将估计的热图从不同的XAI方法与地面真理进行了比较,以确定特定XAI方法表现良好或差的示例。我们认为,本文介绍的基准对于在地球科学中进一步应用神经网络以及更客观的评估和对XAI方法的准确实施非常重要,这将增加模型信任并帮助发现新科学。
translated by 谷歌翻译